《Harness Engineering：如何为 AI 这匹野马打造属于你的马鞍？》

引言 —— 什么是 Harness Engineering？

大模型 + Agent（如 Opencode、Claude Code 等）就像脱缰的野马，爆发力强但极不可控。 Harness Engineering（驾驭工程）就是这副马鞍。马鞍不是买来就有的，需要开发者自己打造并持续优化。分享我个人的“马鞍”配方——如何通过工具链组合、多模型协作与严格的 SOP，彻底驯服 AI 编程助手。

我的“马鞍”材质

核心 Agent 与技能库： 主力：Opencode
- 依赖 superpowers 提供高级技能流转。
订阅策略： 订阅 一家便宜的量大的例如minimax、glm或则opencode go 和 一家比较贵高性能多模态模型的例如gpt、Claud。如果你是在资金有限可以纯国产glm+minimax
五大外围挂载工具（马具配件）：
1. 查找官方代码片段： grep_app mcp。
2. 最佳实践检索： context 7 mcp (寻找各项目的标准范式)。
3. 联网搜索能力： searxng-cli (轻量化搜索)或者使用你订阅套餐里面官方提供的搜索工具均可。
4. 浏览器： agent-browser cli 我比较推荐这个在最大程度节省上下文的同时功能还比较完善官方自带skill安装方便。
5. UI 视觉流： variant.com (出设计稿) + 任意一家多模态模型 (看图写前端代码)。
选型哲学： 为什么要用 CLI + Skill 的方式？—— 极度节省 Token，避免上下文污染。

Pasted image 20260407153031

驯马实战

Step 1: 脑内建模与模块拆解

先在人脑中构建最终成品雏形和大概架构。
将庞大的系统拆分为极小的模块。
注入上下文： 把模块需求喂给 Agent 前，手动追加必需的第三方平台 Key、接口规范或文档链接。

Step 2: 需求对齐与 Spec 确立

头脑风暴： 调用 superpowers 的技能，与 Agent 不断对话，消除需求歧义。
灵魂拷问（防呆机制）： 在让 AI 生成 Spec（规格说明书）前，必须问它一个问题：“你打算如何验证交付结果符合需求？”
人类一审： AI 将思考后的验收标准写入 Spec，人类进行第一次审阅，确保方向不跑偏。

Step 3: 技术选型与 Plan 编写

基于确定的 Spec，要求 AI 在写 Plan 前，先声明拟采用的技术栈。
强制调研： 让 AI 通过 context 7 或 grep_app 搜索该技术栈的行业最佳实践和使用方法，坚决杜绝“AI 凭空想象代码”。
生成最终的 Plan（执行计划书）。

Step 4: 异构模型交叉审阅

策略： 新启一个 Session，引入非同源模型（例如用 gpt（kimi）审查 claude（glm）生成的文档），打破单一模型的思维定势。
审阅清单：
1. 是否偏离 Spec？
2. 是否出现相互冲突问题？
3. 是否出现逻辑不自洽？
4. 是否具备鲁棒性？
5. 测试是否全面？
6. 计划中提到的路径、函数等是否是瞎编的？
7. 当前 Plan 给一个“傻子”是否能够完整执行？

第四部分：马鞍的“变速箱”

**算力路由：
- 高价高性能模型： 只用于头脑风暴、Plan 编写、Code Review 和验收。
- 便宜量大模型： 在 Spec 和 Plan 已经极度严谨（约束好）的情况下，直接用便宜模型配合 superpowers:subagent-driven-development 技能一步步执行，因为“傻子也能照着做”。
上下文洁癖：
- 所有的文档检索、项目探索等高频消耗且容易污染记忆的动作，全部外包给子 Agent (Sub-agent) 去做。
- 永远保证主 Agent 的上下文（Context）绝对干净。

第五部分：结语

AI 编程不再是比拼谁的 Prompt 写得长，而是比拼谁的“工程化管线（Pipeline）”设计得严密。通过规范的 Spec、交叉审阅、子 Agent 分包和严格的验收条件，我们就把一匹狂奔的野马，变成了一支指哪打哪的精锐骑兵。

《Harness Engineering：如何为 AI 这匹野马打造属于你的马鞍？》 ​

引言 —— 什么是 Harness Engineering？ ​

我的“马鞍”材质 ​

驯马实战 ​

Step 1: 脑内建模与模块拆解 ​

Step 2: 需求对齐与 Spec 确立 ​

Step 3: 技术选型与 Plan 编写 ​

Step 4: 异构模型交叉审阅 ​

第四部分：马鞍的“变速箱” ​

第五部分：结语 ​